STRING, INT, BOOLEAN, FLOAT এর ব্যবহার গাইড ও নোট

Big Data and Analytics - হাইভ (Hive) - Data Types এবং File Formats
367

Hive, Hadoop এর উপরে তৈরি একটি ডেটাবেস সিস্টেম, যা SQL-অনুরূপ কুয়েরি ভাষা (HiveQL) ব্যবহার করে ডেটা প্রক্রিয়া করে। Hive বিভিন্ন ধরনের ডেটা টাইপ সমর্থন করে, যার মধ্যে STRING, INT, BOOLEAN, এবং FLOAT অন্যতম। এগুলির প্রতিটি ডেটা টাইপের উদ্দেশ্য এবং ব্যবহার বিভিন্ন ধরনের ডেটা সংরক্ষণ ও বিশ্লেষণ করতে সাহায্য করে।

STRING


STRING ডেটা টাইপ ব্যবহার করা হয় যে কোনো ধরনের টেক্সট (অক্ষর বা ক্যারেক্টার) সংরক্ষণ করতে। Hive-এ STRING ডেটা টাইপ ব্যবহার করা হয় যখন কোনো ডেটার আকার অপরিবর্তনীয় না হয়ে একাধিক অক্ষর বা চরিত্র হতে পারে।

STRING এর ব্যবহার:

CREATE TABLE employees (
  id INT,
  name STRING,
  department STRING
);

এখানে name এবং department কলামগুলো STRING টাইপ, কারণ এই কলামগুলোতে টেক্সট ডেটা থাকবে।

STRING ইনসার্ট করা:

INSERT INTO TABLE employees
VALUES (1, 'John Doe', 'Sales');

এখানে John Doe এবং Sales STRING টাইপের ডেটা।

INT


INT (Integer) ডেটা টাইপ ব্যবহার করা হয় পূর্ণসংখ্যা (whole numbers) সংরক্ষণ করার জন্য। Hive-এ INT ডেটা টাইপ ব্যবহার করে এমন সব ডেটা সংরক্ষণ করা যায়, যেগুলি কোনো দশমিকের প্রয়োজন নেই।

INT এর ব্যবহার:

CREATE TABLE employees (
  id INT,
  age INT
);

এখানে id এবং age কলামগুলো INT টাইপ, কারণ এগুলোতে পূর্ণসংখ্যা ডেটা থাকবে।

INT ইনসার্ট করা:

INSERT INTO TABLE employees
VALUES (1, 30);

এখানে 1 এবং 30 INT টাইপের ডেটা।

BOOLEAN


BOOLEAN ডেটা টাইপ ব্যবহার করা হয় সত্য (true) বা মিথ্যা (false) মান সংরক্ষণ করার জন্য। এটি সাধারণত শর্তাধীন কুয়েরি এবং ফিল্টারিংয়ে ব্যবহৃত হয়।

BOOLEAN এর ব্যবহার:

CREATE TABLE employees (
  id INT,
  name STRING,
  is_active BOOLEAN
);

এখানে is_active একটি BOOLEAN টাইপ, যেটিতে true বা false মান থাকবে।

BOOLEAN ইনসার্ট করা:

INSERT INTO TABLE employees
VALUES (1, 'John Doe', true);

এখানে true BOOLEAN টাইপের মান।

FLOAT


FLOAT ডেটা টাইপ ব্যবহার করা হয় দশমিক সংখ্যা (decimal numbers) সংরক্ষণ করার জন্য। এটি সাধারণত যখন ডেটার মান দশমিক সঠিকতা প্রয়োজন হয়, তখন ব্যবহার করা হয়। FLOAT টাইপ ব্যবহার করে আমরা ডেটার একটি নির্দিষ্ট সঠিকতা (precision) সংরক্ষণ করতে পারি।

FLOAT এর ব্যবহার:

CREATE TABLE employees (
  id INT,
  name STRING,
  salary FLOAT
);

এখানে salary কলামটি FLOAT টাইপ, কারণ এখানে বেতন একটি দশমিক মান হতে পারে।

FLOAT ইনসার্ট করা:

INSERT INTO TABLE employees
VALUES (1, 'John Doe', 50000.75);

এখানে 50000.75 FLOAT টাইপের ডেটা, যেখানে একটি দশমিক মান রয়েছে।


ডেটা টাইপ নির্বাচন


যখন Hive-এ টেবিল তৈরি করা হয়, তখন সঠিক ডেটা টাইপ নির্বাচন করা খুবই গুরুত্বপূর্ণ, কারণ এটি ডেটার সঠিকতা, পারফরম্যান্স এবং স্টোরেজের সাথে সম্পর্কিত। উদাহরণস্বরূপ:

  • যদি কোনো কলামে শুধুমাত্র পূর্ণসংখ্যা ডেটা থাকতে পারে, তাহলে INT টাইপ ব্যবহার করা হবে।
  • যদি কোন কলামে টেক্সট ডেটা থাকতে পারে, তবে STRING টাইপ ব্যবহার করা হবে।
  • BOOLEAN ব্যবহার করা হবে যদি আপনি শুধুমাত্র দুটি মান (সত্য/মিথ্যা) সংরক্ষণ করতে চান।
  • FLOAT টাইপ ব্যবহার করা হবে যদি ডেটা দশমিক সঠিকতার প্রয়োজন হয়, যেমন বেতন বা অন্যান্য পরিমাণ।

উপসংহার


Hive-এ STRING, INT, BOOLEAN, এবং FLOAT বিভিন্ন ডেটা টাইপের মধ্যে প্রতিটি টাইপের নির্দিষ্ট ব্যবহার রয়েছে। এই ডেটা টাইপগুলি যথাযথভাবে ব্যবহার করে আপনি Hive-এ সঠিকভাবে ডেটা সংরক্ষণ এবং বিশ্লেষণ করতে পারবেন। Hive-এর এই বৈশিষ্ট্যগুলি Hadoop প্ল্যাটফর্মের বিশাল ডেটাসেট প্রক্রিয়া করার জন্য গুরুত্বপূর্ণ এবং কার্যকরী।

Content added By
Promotion

Are you sure to start over?

Loading...